Narrow your search

Library

KU Leuven (3)

KBR (1)


Resource type

dissertation (2)

book (1)


Language

English (2)

Dutch (1)


Year
From To Submit

2006 (1)

2003 (1)

2001 (1)

Listing 1 - 3 of 3
Sort by

Dissertation
Techniques for more efficient ILP data mining engines
Authors: ---
ISBN: 9056827367 Year: 2006 Publisher: Leuven Katholieke Universiteit Leuven

Loading...
Export citation

Choose an application

Bookmark

Abstract

Het doel van data mining is het vinden van regels (of hypothesen) die niet-triviale relaties, patronen of eigenschappen van een grote hoeveelheid gegevens omschrijven, teneinde de gegevens beter te begrijpen. Inductief Logisch Programmeren (ILP) is een relationele data mining techniek gebaseerd op eerste orde logica. Logica is een krachtig en natuurlijk formalisme voor het voorstellen van kennis, wat ILP toelaat om concepten te leren die niet geleerd kunnen worden met een minder krachtig formalisme. Omwille van zijn hoge expressiviteit is de ruimte van alle mogelijke hypothesen echter zeer complex, waardoor het zoeken naar een goede hypothese een complexe taak wordt. Een van de belangrijkste factoren bij de uitvoering van ILP algoritmen is de motor die door het algoritme gebruikt wordt. Deze motor is verantwoordelijk voor het evalueren van kandidaatshypothesen (of queries) op de gegevens, en voorziet primitieven voor het ILP algoritme om de evaluatie van queries te sturen. In dit werk presenteren we verschillende technieken voor het optimaliseren van motoren gebruikt door ILP algoritmen. We combineren twee bestaande onafhankelijke technieken voor query-evaluatie: de once-transformatie, dewelke redundante uitvoering binnen dezelfde query probeert te vermijden, en query packs, dewelke redundantie in de uitvoering van meerdere queries probeert te vermijden. De algemene aanpak voor query-evaluatie is om de query te compileren naar een efficiëntere versie alvorens hem uit te voeren. We bestuderen alternatieven voor deze aanpak, en stellen een performantere compilatietechniek voor, tesamen met een luie variant die enkel delen van queries compileert als deze nodig zijn. Analyse en debuggen van query uitvoering is een belangrijk deel van het ontwikkelingsproces van meer efficiënte query uitvoeringstechnieken. We stellen een spoorgebaseerde aanpak voor het debuggen en analyseren van de uitvoeringsstap van ILP algoritmen. We doen een studie van het afwegen van geheugenruimte tegenover uitvoeringstijd op verschillende niveaus van ILP uitvoering. Deze technieken bevatten predikaatstabellering en programmaspecialisatie, tesamen met meer algoritme-specifieke technieken. The goal of data mining is to find rules (or hypotheses) that describe non-trivial relations, patterns or properties of large quantities of data, thus helping in understanding the data better. Inductive Logic Programming (ILP) is a relational data mining technique based on first order logic. Logic provides a powerful yet natural formalism for representing knowledge, allowing ILP to learn concepts that cannot be learned using less powerful data mining techniques. However, because of its high expressivity, the space of all possible hypotheses is also very complex, due to which the search for good hypotheses becomes a complex task. One of the most important factors in the execution of ILP algorithms is the engine underlying the algorithm. This engine is responsible for evaluating candidate hypotheses (or queries) on the data, and provides primitives to the ILP algorithm for guiding the evaluation of queries. In this work, we present different techniques for optimizing the engines used by ILP algorithms. We combine two existing, independent, and successful optimization techniques for query evaluation: the once transformation, which aims to avoid redundant execution within a single query, and query packs, which avoid redundancy in the execution of multiple queries. The general approach to query evaluation is to compile the query to a more efficient version instead of executing the query directly. We study alternatives to this approach, and propose a more performant compilation technique, together with a lazy variant that only compiles parts of queries as they are needed. Analysis and debugging of query execution is an important part of the development of more efficient query execution techniques. We present a trace-based technique for debugging and analyzing the execution step of ILP algorithms. We present a study of trading off extra memory for execution time on different levels of ILP execution. These techniques include predicate tabling and program specialization, together with more ILP algorithm-specific techniques. De hoeveelheid gegevens die opgeslagen worden op digitale media groeit zeer snel. Het hoofddoel van het bewaren van deze gegevens is om er nieuwe informatie uit af te leiden: supermarken verzamelen gegevens over het koopgedrag van hun klanten, om zo hun marketing campagnes beter te kunnen richten; zoekmotoren bewaren informatie over vorige zoekopdrachten om gepersonaliseerde resultaten te kunnen tonen, ... Het doel van data mining is om uit deze grote hoeveelheden gegevens nieuwe informatie af te leiden. Inductief Logisch Programmeren (ILP) is een krachtige data mining techniek, gebaseerd op logisch redeneren. Omwille van de complexe informatie die ILP kan afleiden uit gegevens, is het afleiden van deze informatie zelf een zeer zware taak. Een cruciaal element bij het afleiden van nieuwe informatie, gebruik makend van ILP, is de motor van het ILP systeem. In dit werk bestuderen we technieken voor het bouwen van efficiëntere ILP motoren.


Book
An execution mechanism for combining query packs and once-transformations
Authors: --- ---
Year: 2003 Publisher: Leuven KUL. Department of computer science

Loading...
Export citation

Choose an application

Bookmark

Abstract

Keywords


Dissertation
Bepaling van minimale grootte van arrays in VLSI ontwerp.
Authors: --- ---
Year: 2001 Publisher: Leuven K.U.Leuven. Faculteit Toegepaste wetenschappen

Loading...
Export citation

Choose an application

Bookmark

Abstract

Keywords

Listing 1 - 3 of 3
Sort by